智能论文笔记

Development of a mobile robot assistant for wind turbines manufacturing

Ali Ahmad Malik

分类：机器人

2022-08-06

风力涡轮机的评级能力提高的推力导致更大的发电机，更长的刀片和更高的塔。目前，风力涡轮机制造商提供了多达16兆瓦的风力涡轮机，在过去五年中，设计能力近60％。这些涡轮机的制造涉及组装巨大的组件。由于设计的频繁变化和涉及的各种任务，因此不可能使其成为劳动密集型的活动。但是，大型组件的处理和组装挑战了人类的能力。本文提出使用移动机器人助手来部分自动化风力涡轮机制造。机器人助手可以降低生产成本和更好的工作条件。该文章介绍了人类操作员有效执行风力涡轮机的机器人助手的开发。该案件来自领先的风力涡轮机制造商。开发的系统还适用于其他大型制造案件，涉及密集型手动工作。

translated by 谷歌翻译

Improving Generalization of Pre-trained Language Models via Stochastic Weight Averaging

Peng Lu , Ivan Kobyzev , Mehdi Rezagholizadeh , Ahmad Rashid , Ali Ghodsi , Philippe Langlais

分类：自然语言处理 | 机器学习

2022-12-12

Knowledge Distillation (KD) is a commonly used technique for improving the generalization of compact Pre-trained Language Models (PLMs) on downstream tasks. However, such methods impose the additional burden of training a separate teacher model for every new dataset. Alternatively, one may directly work on the improvement of the optimization procedure of the compact model toward better generalization. Recent works observe that the flatness of the local minimum correlates well with better generalization. In this work, we adapt Stochastic Weight Averaging (SWA), a method encouraging convergence to a flatter minimum, to fine-tuning PLMs. We conduct extensive experiments on various NLP tasks (text classification, question answering, and generation) and different model architectures and demonstrate that our adaptation improves the generalization without extra computation cost. Moreover, we observe that this simple optimization technique is able to outperform the state-of-the-art KD methods for compact models.

translated by 谷歌翻译

Distilling Facial Knowledge With Teacher-Tasks: Semantic-Segmentation-Features For Pose-Invariant Face-Recognition

Ali Hassani , Zaid El Shair , Rafi Ud Duala Refat , Hafiz Malik

分类：计算机视觉

2022-09-02

本文展示了一种新的方法，可以使用语义分段特征提高面部识别姿势不变。拟议的SEG-DISTILD-ID网络共同学习识别和语义分割任务，然后将分割任务“蒸馏”（Mobilenet编码器）。在强调头置变化的公开数据集中，针对三个最先进的编码器进行了基准测试。实验评估表明，SEG-DISTILD-ID网络显示出显着的鲁棒性优势，相比之下，RESNET-101的测试准确性达到99.9％，VGG-19的96.1％，IntectionV3的vgg-19和96.3％。这是使用顶部编码器推理参数的大约十分之一来实现的。这些结果表明，蒸馏的语义分割特征可以有效地解决面部识别姿势不变。

translated by 谷歌翻译

HTML版本

On Evaluating Self-Adaptive and Self-Healing Systems using Chaos Engineering

Moeen Ali Naqvi , Sehrish Malik , Merve Astekin , Leon Moonen

分类：神经与进化计算

2022-08-28

随着在各个领域中自适应系统的越来越多，对评估其正确行为的策略的需求越来越多。特别是旨在提供弹性和容忍性的自我修复系统，通常会在关键和高度动态的环境中处理意外的故障。它们的反应性和复杂行为使评估这些系统是否按照期望的目标执行起来挑战。最近，一些研究对缺乏自我修复行为的系统评估方法表示关注。在本文中，我们提出了国际象棋，这是一种基于混乱工程的自适应和自我修复系统系统评估的方法。混乱工程是一种使系统遇到意外条件和场景的方法。它在帮助开发人员构建有弹性的微服务体系结构和网络物理系统方面表现出了巨大的希望。国际象棋通过使用混乱工程来评估自我修复系统能够承受这种扰动的能力来解决这个想法。我们通过对自我修复的智能办公环境进行探索性研究来研究这种方法的可行性。该研究有助于我们探索方法的承诺和局限性，并确定需要额外工作的方向。我们总结了经验教训的摘要。

translated by 谷歌翻译

A mixed formulation for physics-informed neural networks as a potential solver for engineering problems in heterogeneous domains: comparison with finite element method

Shahed Rezaei , Ali Harandi , Ahmad Moeineddin , Bai-Xiang Xu , Stefanie Reese

分类：机器学习

2022-06-27

物理信息神经网络（PINN）能够找到给定边界值问题的解决方案。我们使用有限元方法（FEM）的几个想法来增强工程问题中现有的PINN的性能。当前工作的主要贡献是促进使用主要变量的空间梯度作为分离神经网络的输出。后来，具有较高衍生物的强形式应用于主要变量的空间梯度作为物理约束。此外，该问题的所谓能量形式被应用于主要变量，作为训练的附加约束。所提出的方法仅需要一阶导数来构建物理损失函数。我们讨论了为什么通过不同模型之间的各种比较，这一点是有益的。基于配方混合的PINN和FE方法具有一些相似之处。前者利用神经网络的复杂非线性插值将PDE及其能量形式最小化及其能量形式，而后者则在元素节点借助Shape函数在元素节点上使用相同。我们专注于异质固体，以显示深学习在不同边界条件下在复杂环境中预测解决方案的能力。针对FEM的解决方案对两个原型问题的解决方案进行了检查：弹性和泊松方程（稳态扩散问题）。我们得出的结论是，通过正确设计PINN中的网络体系结构，深度学习模型有可能在没有其他来源的任何可用初始数据中解决异质域中的未知数。最后，关于Pinn和FEM的组合进行了讨论，以在未来的开发中快速准确地设计复合材料。

translated by 谷歌翻译

Popular decision tree algorithms are provably noise tolerant

Guy Blanc , Jane Lange , Ali Malik , Li-Yang Tan

分类：机器学习

2022-06-17

使用增强的框架，我们证明所有基于杂质的决策树学习算法（包括经典的ID3，C4.5和CART）都具有很高的噪音耐受性。我们的保证在讨厌的噪声的最强噪声模型下保持，我们在允许的噪声速率上提供了近乎匹配的上和下限。我们进一步表明，这些算法简单，长期以来一直是日常机器学习的核心，在嘈杂的环境中享受可证明的保证，这些环境是由关于决策树学习的理论文献中现有算法无与伦比的。综上所述，我们的结果增加了一项持续的研究线，该研究旨在将这些实际决策树算法的经验成功放在牢固的理论基础上。

translated by 谷歌翻译

The exploitation of Multiple Feature Extraction Techniques for Speaker Identification in Emotional States under Disguised Voices

Noor Ahmad Al Hindawi , Ismail Shahin , Ali Bou Nassif

分类：自然语言处理

2021-12-15

由于人工智能的改进，扬声器识别（SI）技术带来了一个伟大的方向，现在广泛用于各种各样的领域。Si最重要的组件之一是特征提取，对Si过程和性能具有显着影响。结果，彻底研究，对比和分析了许多特征提取策略。本文利用了情绪环境下伪装声音中的发言者识别五个不同的特征提取方法。为了显着评估这项工作，使用了三种效果：高倾斜，低音和电子语音转换（EVC）。实验结果报道称，级联的熔融频率谱系数（MFCCs），MFCCS-DERTA和MFCCS-DELTA-DELTA是最佳特征提取方法。

translated by 谷歌翻译

Multi-Expert Human Action Recognition with Hierarchical Super-Class Learning

Hojat Asgarian Dehkordi , Ali Soltani Nezhad , Hossein Kashiani , Shahriar Baradaran Shokouhi , Ahmad Ayatollahi

分类：计算机视觉

2021-12-13

在静止图像人类行动识别中，现有研究主要利用额外的边界框信息以及类标签来减轻静态图像中的时间信息;但是，使用手动注释准备额外数据是耗时的，也容易出现人类错误。此外，现有研究没有解决与长尾分布的行动识别。在本文中，我们提出了一种用于人类行动认可的两相多方专家分类方法，以通过超级学习和没有任何额外信息应对长尾分布。要为每个超级类别选择最佳配置，并在不同动作类之间表征类间依赖关系，我们提出了一种基于图形的类别选择（GCS）算法。在提出的方法中，粗粒阶段选择最相关的细粒度专家。然后，细粒度专家编码每个超级级别的复杂细节，使得级别的变化增加。在各种公共人类行动识别数据集上进行了广泛的实验评估，包括斯坦福福德40，Pascal VOC行动，Bu101 +和iHar数据集。实验结果表明，该方法产生了有希望的改善。更具体地说，在Ihar，Sanford40，Pascal VOC 2012行动和BU101 +基准中，所提出的方法优于最先进的研究，以8.92％，0.41％，0.66％和2.11％，计算成本远远较低没有任何辅助注释信息。此外，证明，在解决长尾分布的动作识别方面，该方法通过显着的边缘来实现其对应物。

translated by 谷歌翻译

On the power of adaptivity in statistical adversaries

Guy Blanc , Jane Lange , Ali Malik , Li-Yang Tan

分类：机器学习

2021-11-19

我们研究了算法收到I.I.D的统计问题中对抗噪声模型的基本问题。从分发$ \ mathcal {d} $绘制。这些对手的定义指定了允许的损坏类型（噪声模型）以及可以进行这些损坏（适应性）;后者区别了唯一可以损坏分发$ \ mathcal {d} $和适应性对手的疏忽，这些对手可以损坏他们的腐败依赖于从$ \ mathcal {d} $绘制的特定样本$ s $。在这项工作中，我们调查了在文献中研究的所有噪声模型中是否有效地相当于自适应对手。具体而言，算法$ \ mathcal {a} $的行为可以在不受算法$ \ mathcal {a}'$的情况下始终受到适应性对手的存在的良好近似？我们的第一个结果表明，这确实是在所有合理的噪声模型下广泛的统计查询算法的情况。然后，我们显示在附加噪声的具体情况下，这种等价物适用于所有算法。最后，我们将所有算法和所有合理的噪声模型中的最丰富的一般性映射到最完整的普遍性的方法。

translated by 谷歌翻译

Simulating Realistic MRI variations to Improve Deep Learning model and visual explanations using GradCAM

Muhammad Ilyas Patel , Shrey Singla , Razeem Ahmad Ali Mattathodi , Sumit Sharma , Deepam Gautam , Srinivasa Rao Kundeti

分类：人工智能 | 计算机视觉

2021-11-01

在医学领域，MRI的地标检测在减少扫描计划，图像登记等中的任务中减少医疗技术人员努力方面发挥着重要作用。首先，88个地标在三个相应的观点中分布在三个相应的观点中 - 矢状，冠状动脉和轴向手动注释，专家临床技术人员的后期准则被划分解剖学，以便更好地定位现有地标，以便即使在斜扫描中也定位重要的地图标志性地标。为了克服有限的数据可用性，我们实施现实的数据增强以生成合成3D容量数据。我们使用修改后的HIGHRES3DNET模型来解决脑MRI容量的地标检测问题。为了在视觉上解释我们的培训模型，并从较弱的模型中辨别更强的模型，我们实现了梯度加权类激活映射（GRAC-CAM），它产生突出显示模型聚焦的区域的粗糙定位图。我们的实验表明，该方法显示出有利的结果，并且整个管道可以扩展到可变数量的地标和其他解剖。

translated by 谷歌翻译